FILTER MODE ACTIVE

#оценка LLM

Найдено записей: 7

#оценка LLM26.10.2025

Стресс-тест спецификаций моделей: исследование Anthropic и Thinking Machines выявляет, где модели расходятся

'Команда из Anthropic и Thinking Machines провела стресс-тест спецификаций с 300k+ сценариев ценностных компромиссов и показала, что сильные расхождения предсказывают проблемы в спецификациях.'

#оценка LLM23.07.2025

Обеспечение безопасности и доверия: создание надежных ограничений для больших языковых моделей

Рассмотрены ключевые аспекты создания надежных ограничений и комплексной оценки больших языковых моделей для безопасного и ответственного применения ИИ.

#оценка LLM13.05.2025

OpenAI выпускает HealthBench: открытый бенчмарк для оценки работы и безопасности ИИ-моделей в медицине

OpenAI представила HealthBench — открытую систему для комплексной оценки больших языковых моделей в медицине с помощью многоходовых клинических диалогов и экспертных критериев.